草庐IT

PDF 内容和 SEO

全部标签

ruby-on-rails - 从 Rails 3 中的默认 ActionController LogSubscriber 修改日志格式和内容

上下文:在一个Rails3项目中,我想自定义(大量)来自ActionController的“Processing”和“Completedin”日志行的格式和内容。这是为了让它们与旧版Rails2.3应用程序的(也是自定义的)格式相匹配,从而允许重复使用各种分析工具。使它们成为固定字段(通过在必要时使用占位符)还可以更容易地使用(比如)awk对它们进行临时查询,或者将它们加载到数据库或splunk中而无需智能解析。我通过forkrails和patching快速而严厉地实现了这个目标有问题的LogSubscriber,但我现在希望以正确的方式做到这一点。这是我认为我想做的事情:创建一个Lo

ruby - 为 Heroku 静态编译 pdftk。需要将 PDF 拆分为单页文件

所以我们使用heroku来托管我们的rails应用程序。我们搬到了雪松堆。此堆栈未安装pdftk库。我联系了支持人员,被告知为amd64ubuntu静态编译它并将其包含在我的应用程序中。事实证明,这比我想象的要难。最初我下载了ubuntu的包(http://packages.ubuntu.com/natty/pdftk),将其解压缩,并包含二进制文件和共享库。我收到奇怪的错误,例如:UnhandledJavaException:java.lang.NullPointerExceptionatcom.lowagie.text.pdf.PdfCopy.copyIndirect(pdftk)

ruby - Jekyll:检查帖子内容是否为空

我在Jekyll项目中有一系列帖子,其中一些只有标题,一些有标题和内容。我想在每种情况下对帖子做不同的事情。例如:{%forpostinsite.categories.publications%}{{post.title}}{%ifpost.content==""orpost.content==nilorpost.content==blank%}Nothinghere.{%else%}{{post.content}}{%endif%}{%endfor%}但是if语句实际上并没有捕获空帖子。我的条件基于thispage,但是这3种可能性都没有捕捉到空帖子。关于如何处理这些帖子有什么想法吗

ruby-on-rails - 如何让 Haml 正确呈现 pre 标签的内容?

我读了Hamldocs他们在哪里谈论pre标记和“保留空格”。根据文档,pre默认情况下“保留空格”,您需要使用~运算符输出标签的内容以使其正确呈现。按照推荐的做法,我有这个:%pre~@calendar.main_template浏览器输出:(这可能有点令人困惑——应用程序允许用户操作Haml代码,所以我实际上是在UI中显示Haml代码。)%div=events想要什么输出:%div=events我也试过使用=而不是~.也试过%pre>,%pre,和%pre>所有结果都相同。 最佳答案 你想要保留。%pre=preserve"Il

ruby-on-rails - rails : new asset path for PDF's not being recognised

我有一个Rails应用程序,我在其中添加了一个新Assets。我在Assets文件夹中添加了一个名为information的新文件夹,其中有一个名为xyz.pdf的PDF。问题是我正在尝试链接到该PDF,但是应用程序抛出错误:Noroutematches[GET]"/assets/information/xyz.pdf"我在config/application.rb文件中添加了新Assets:config.assets.paths这是我正在使用的链接:"links"%> 最佳答案 在使用Assets管道时,您应该通过以下方式引用应用

ruby - 将元数据添加到 PDF

我需要将元数据添加到我使用prawn创建的PDF中.该元数据稍后可能会被pdf-reader提取。.此元数据将包含内部文档编号和下游工具所需的其他信息。将元数据与PDF的每一页相关联会很方便。ThePDFspecification声称我可以将每页私有(private)数据存储在“Page-PieceDictionary”中。第14.5节指出:Apage-piecedictionary(PDF1.3)maybeusedtoholdprivateconformingproductdata.ThedatamaybeassociatedwithapageorformXObjectbymeans

ruby - 如何使用 XPath 和 Nokogiri 获取 XML 节点的内容

我有这样的代码:@doc=Nokogiri::HTML(open(url)@doc.xpath(query).eachdo|html|putshtml#howgetcontentofanodeend我如何获取节点的内容而不是像这样: 最佳答案 这是READMEfile中的概要示例为Nokogiri展示了一种使用CSS、XPath或混合的方法:require'nokogiri'require'open-uri'#GetaNokogiri::HTML:Documentforthepagewe’reinterestedin...doc=N

ruby - 如何通过 CSS 而不是 XPath 选择带有文本内容的元素?

“Nokogiri:Howtoselectnodesbymatchingtext?”可以通过XPath执行此操作,但是,我正在寻找一种使用与元素文本匹配的CSS选择的方法。PyQuery和PHPQuery可以做到这一点。没有用于Ruby的jQueryAPI库吗? 最佳答案 Nokogiri(现在)实现了jQuery选择器,使得搜索节点文本成为可能:例如:require'nokogiri'html='foobar'doc=Nokogiri::HTML(html)doc.at('p:contains("bar")').text.stri

ruby - 从 ruby​​ 中的 PDF 中提取文本(我有 PDF 的链接)

我有一个链接http://www.downloads.com/help.pdf我想下载这个,然后解析它来获取文本内容。我该怎么做?我还计划标记化(如果有这样的词)提取的文本 最佳答案 您可以使用pdf-readergem(example/text.rb示例很简单并且对我有用):https://github.com/yob/pdf-reader或命令行实用程序pdftotext。 关于ruby-从ruby​​中的PDF中提取文本(我有PDF的链接),我们在StackOverflow上找到一

ruby - 确定一个数组是否包含ruby中另一个数组的内容

在ruby​​中,我如何测试一个数组不仅包含另一个数组的元素,而且以特定顺序包含它们?correct_combination=[1,2,3,4,5][1,5,8,2,3,4,5].function_name(correct_combination)#=>false[8,10,1,2,3,4,5,9].function_name(correct_combination)#=>true我尝试使用include,但那是用来测试[1,2,3].include?(2)是否为真。 最佳答案 你可以使用each_cons方法:arr=[1,2,3